خزش متمرکز وب با هدف کشف اسناد وب معنایی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی
  • نویسنده ریحانه امامدادی
  • استاد راهنما محسن کاهانی
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1392
چکیده

با توجه به گسترش روزافزون وب معنایی و افزایش حجم داده های معنایی بر روی وب، لازم است تا این داده ها با کمک ابزار هایی از سطح وب جمع آوری شوند تا بتوان از آنها در کاربرد های مختلف استفاده کرد. یکی از ابزار های مهم در این زمینه، خزنده وب است. خزنده وب، برنامه ای است که اسناد را به طور خودکار و با دنبال کردن پیوند های داخل آنها، از سطح وب جمع آوری می کند. در حوزه وب معنایی، هدف خزنده جمع آوری اسناد وب معنایی است. عدم پیوند کافی بین این اسناد و احاطه شدن آنها توسط اسناد html، موجب شده است تا بسیاری از خزنده های وب معنایی، علاوه بر اسناد وب معنایی، اسناد html را نیز واکشی کنند. اما با توجه به حجم بالای اسناد html و غیر معنایی بودن بسیاری از پیوند های داخل آنها، واکشی این اسناد و پیمودن همه مسیر های ایجاد شده توسط آنها، باعث اتلاف منابع و پایین آمدن سرعت دستیابی به اسناد وب معنایی می شود. در این پایان نامه، یک خزنده وب معنایی ارائه شده است که از خزش متمرکز برای حل مشکلات بیان شده استفاده می کند. در خزش متمرکز، هدف خزنده جمع آوری اسناد در مورد یک موضوع خاص است و پیوند ها بر مبنای میزان ارتباطشان با موضوع مورد نظر اولویت بندی می شوند. اما در خزنده پیشنهادی، به جای خزش موضوعی، پیوند های استخراج شده از اسناد html تحلیل می شوند و بر مبنای توانایی شان در دستیابی به اسناد وب معنایی اولویت بندی می شوند. برای این منظور، خزنده از دو تابع ارتباط استفاده می کند. نتایج ارزیابی ها نشان می دهد که بکارگیری فرآیند خزش متمرکز و توابع ارتباط پیشنهادی، موجب دستیابی سریعتر به اسناد وب معنایی و کاهش حجم واکشی اسناد غیر معنایی می شود.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

کشف سیر تحوّل در حوزۀ «وب معنایی» با رویکرد نوین RPYS

هدف: با استفاده از تحلیل مآخذ استنادی با تأکید بر سال انتشار این مآخذ می­توان اهمیت آثار پیشین را برشمرد و خاستگاه­های تاریخی یک حوزۀ پژوهشی را آشکار نمود. در این پژوهش، بر آنیم تا با روش جدیدی به نام طیف سنجی سال انتشار مآخذ، مهم­ترین آثار تاریخی در حوزه وب معنایی را مشخص نماییم. روش‌شناسی: داده­های اولیه این پژوهش، که با استفاده از روش علم­سنجی و برای بررسی ریشه­های تاریخی حوزه وب­معنایی انجا...

متن کامل

کشف سیر تحوّل در حوزۀ «وب معنایی» با رویکرد نوین RPYS

هدف: با استفاده از تحلیل مآخذ استنادی با تأکید بر سال انتشار این مآخذ می­توان اهمیت آثار پیشین را برشمرد و خاستگاه­های تاریخی یک حوزۀ پژوهشی را آشکار نمود. در این پژوهش، بر آنیم تا با روش جدیدی به نام طیف سنجی سال انتشار مآخذ، مهم­ترین آثار تاریخی در حوزه وب معنایی را مشخص نماییم. روش‌شناسی: داده­های اولیه این پژوهش، که با استفاده از روش علم­سنجی و برای بررسی ریشه­های تاریخی حوزه وب­معنایی انجا...

متن کامل

نقش وب معنایی در بازیابی اطلاعات

هدف: معرفی نسل آتی وب که وب معنایی است و از طریق تجهیز اطلاعات با اجزاء معناشناختی مشخص همکاری میان انسان و رایانه را فراهم می نماید. به بیانی دیگر وب معنایی نوعی روش برای کد گذاری و بازیابی اطلاعات است به گونه ای که ماشین ها (رایانه ها) قادر به پردازش و فهم اطلاعات باشند. روش شناسی: در این مقاله با استفاده از روش کتابخانه‌ای و بررسی متون اسناد، در ابتدا به گردآوری اطلاعاتی در مورد شبکه جهانی...

متن کامل

"فضای مفهومی" رویکردی جهت توسعه وب معنایی

هدف از انجام پژوهش حاضر بررسی معنابخشی به بافت از طریق کاربرد نظریه‌هایی همچون نظریه فضاهای مفهومی است. دلیل استفاده از این نظریه این است که این نظریه به بررسی بازنمایی دانش و سازه معنایی می‌پردازد و به چگونگی تشکیل معنا در فضای مفهومی واژگان و کاربرد آنها در بافت توجه دارد. روش: پژوهش کاربردی و روش انجام آن تحلیلی است. یافته‌ها: نتایج پژوهش نشان داد که وب معنایی به عنوان بستری برای بازنمون دان...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023